DE eng

Search in the Catalogues and Directories

Hits 1 – 16 of 16

1
Morphology in the Corsican Language Database (BDLC) : assessment and perspectives ; La morphologie dans la Banque de Données Langue Corse : bilan et perspectives
In: ISSN: 1638-9808 ; EISSN: 1765-3126 ; Corpus ; https://hal.archives-ouvertes.fr/hal-03591866 ; Corpus, Bases, Corpus, Langage - UMR 7320, 2022, Corpus et données en morpholgie, ⟨10.4000/corpus.7115⟩ ; https://journals.openedition.org/corpus/7115 (2022)
BASE
Show details
2
La morphologie dans la Banque de Données Langue Corse : passé, présent, futur
In: ISSN: 1638-9808 ; EISSN: 1765-3126 ; Corpus ; https://hal.archives-ouvertes.fr/hal-03520813 ; Corpus, Bases, Corpus, Langage - UMR 7320, A paraître (2022)
BASE
Show details
3
Language identification, a tool for Corsican and for the evaluation of linguistic resources ; L'identification de langue, un outil au service du corse et de l'évaluation des ressources linguistiques
In: Traitement Automatique des Langues ; https://hal.archives-ouvertes.fr/hal-03633290 ; Traitement Automatique des Langues, 2022, Diversité Linguistique, 62 (3), pp.13-37 ; https://www.atala.org/content/diversité-linguistique-linguistic-diversity-natural-language-processing (2022)
Abstract: International audience ; The constitution of corpora is one of the first priorities faced by less-resourced languages. The emergence of Internet-based resources of increasing size and covering more and more languages may suggest that this issue has been resolved, but this is not the case. Following Caswell et al. (2021), who evaluated several large resources, including one with Corsican content, we conducted an analysis of two corpora including this language: An Crúbadán and W2C. In parallel to a manual evaluation, we considered the possibility of using one or more language identification modules to filter the content of these resources, which turns out to be possible but at the cost of low recall. For this task, we tested and re-trained various systems in order to adapt them to Corsican. This work makes it possible to provide a model allowing the identification of 17 European languages as well as Corsican ; La constitution de corpus est une des premières priorités que rencontrent les langues peu dotées. L’émergence de ressources issues d’Internet, de tailles de plus en plus imposantes et couvrant de nombreuses langues, peut laisser penser que ce point est désormais résolu, ce qui n’est pas le cas. À la suite de Caswell et al. (2021), qui ont évalué plusieurs ressources de grande envergure, dont une disposant de contenu corse, nous avons mené une analyse de deux corpus incluant cette langue : An Crúbadán et W2C. Parallèlement à une évaluation manuelle, nous avons estimé la possibilité d’utiliser un ou plusieurs modules d’identification de langue afin de filtrer le contenu de ces ressources, ce qui s’avère possible mais au prix d’un rappel peu élevé. Pour cette tâche, nous avons testé et réentraîné divers systèmes afin de les adapter au mieux au corse. Ce travail nous permet de mettre à disposition un modèle capable d’identifier le corse ainsi que 17 autres langues européennes.
Keyword: [INFO.INFO-AI]Computer Science [cs]/Artificial Intelligence [cs.AI]; [INFO.INFO-CL]Computer Science [cs]/Computation and Language [cs.CL]; [INFO.INFO-TT]Computer Science [cs]/Document and Text Processing; [SHS.LANGUE]Humanities and Social Sciences/Linguistics; corpora; corpus; corse; Corsican; identification de langue; language identification; langues peu dotées; less-resourced languages; qualité; quality
URL: https://hal.archives-ouvertes.fr/hal-03633290/file/TAL_62_3_1_Kevers_HAL.pdf
https://hal.archives-ouvertes.fr/hal-03633290/document
https://hal.archives-ouvertes.fr/hal-03633290
BASE
Hide details
4
A Survey of Language Technologies Resources and Tools for Corsican
In: https://hal.archives-ouvertes.fr/hal-03228733 ; [Research Report] UMR 6240 CNRS LISA - Université de Corse. 2021 (2021)
BASE
Show details
5
Towards a Corsican Basic Language Resource Kit
In: 12th Language Resources and Evaluation Conference (LREC 2020) ; https://hal.archives-ouvertes.fr/hal-02865699 ; 12th Language Resources and Evaluation Conference (LREC 2020), May 2020, Marseille, France (2020)
BASE
Show details
6
Copyright in the context of tooling up Corsican and other less-resourced languages
In: International Conference on Language Technologies for All (LT4All), Enabling Linguistic Diversity and Multilingualism Worldwide ; https://hal.archives-ouvertes.fr/hal-02880713 ; International Conference on Language Technologies for All (LT4All), Enabling Linguistic Diversity and Multilingualism Worldwide, Dec 2019, Paris, France (2019)
BASE
Show details
7
Tooling up a less-resourced language with NLP : the example of Corsican and the BDLC
In: International Conference on Language Technologies for All (LT4All) Enabling Linguistic Diversity and Multilingualism Worldwide ; https://hal.archives-ouvertes.fr/hal-02880729 ; International Conference on Language Technologies for All (LT4All) Enabling Linguistic Diversity and Multilingualism Worldwide, Dec 2019, Paris, France (2019)
BASE
Show details
8
Tooling up a less-resourced language with NLP : the example of Corsican and BDLC ; Outiller une langue peu dotée grâce au TALN : l’exemple du corse et BDLC
In: 26e Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-02567779 ; 26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.371-380 (2019)
BASE
Show details
9
Tooling up a less-resourced language with NLP : the example of Corsican and BDLC ; Outiller une langue peu dotée grâce au TALN : l’exemple du corse et BDLC
In: 26e Conférence sur le Traitement Automatique des Langues Naturelles ; https://hal.archives-ouvertes.fr/hal-02452276 ; 26e Conférence sur le Traitement Automatique des Langues Naturelles, 2019, Toulouse, France. pp.371-380 (2019)
BASE
Show details
10
Outiller une langue peu dotée grâce au TALN : l’exemple du corse et de la BDLC
In: 26e conférence sur le Traitement automatique des langues naturelles (TALN) ; https://hal.archives-ouvertes.fr/hal-03146186 ; 26e conférence sur le Traitement automatique des langues naturelles (TALN), Jul 2019, Toulouse, France. ATALA, pp.371-380, 2019 (2019)
BASE
Show details
11
Hybrid supervised classification through extended lexical patterns and SVM classifiers ; Classification supervisée hybride par motifs lexicaux étendus et classificateurs SVM
In: 10th International Conference on statistical analysis of textual data (JADT 2010) ; https://hal.archives-ouvertes.fr/hal-02454106 ; 10th International Conference on statistical analysis of textual data (JADT 2010), Jun 2010, Rome, Italie (2010)
BASE
Show details
12
Towards a biographical knowledge base: information extraction and ontology ; Vers une base de connaissances biographique : extraction d’information et ontologie
In: Actes des cinquièmes journées Extraction et Gestion des Connaissances ; Extraction et gestion des connaissances (EGC'2007) ; https://hal.archives-ouvertes.fr/hal-03515763 ; Extraction et gestion des connaissances (EGC'2007), Jan 2007, Namur, Belgique. pp.373--378 ; https://editions-rnti.fr/?inprocid=1001400 (2007)
BASE
Show details
13
MOCA – Multimedia Oral Corpora Administration. Un système de gestion et d'annotation de données orales
In: Corpus et pragmatique. L'interaction verbale dans son contexte situationnel à la lumière des corpus et des bases de données. 3ème Rencontre Fribourgeoise de la Linguistique sur Corpus ; https://hal.archives-ouvertes.fr/hal-03089564 ; Corpus et pragmatique. L'interaction verbale dans son contexte situationnel à la lumière des corpus et des bases de données. 3ème Rencontre Fribourgeoise de la Linguistique sur Corpus, Sep 2006, Fribourg-en-Brisgau, Allemagne (2006)
BASE
Show details
14
Traitement automatisé de l'ambiguïté lexicale en grec ancien
In: Lingvisticae investigationes. - Amsterdam : Benjamins 28 (2005) 2, 235-254
BLLDB
Show details
15
Adaptation des ressources d’Unitex au traitement du grec ancien
In: 24ème conférence internationale grammaires et lexiques comparés ; https://hal.archives-ouvertes.fr/hal-03089594 ; 24ème conférence internationale grammaires et lexiques comparés, Sep 2005, Liverpool, Royaume-Uni (2005)
BASE
Show details
16
Traitement automatisé de l'ambiguïté lexicale en grec ancien. Première approche par application de grammaires locales
In: 23ème conférence internationale grammaires et lexiques comparés ; https://hal.archives-ouvertes.fr/hal-03089602 ; 23ème conférence internationale grammaires et lexiques comparés, Nov 2004, Deauville, France (2004)
BASE
Show details

Catalogues
0
0
0
0
0
0
0
Bibliographies
1
0
0
0
0
0
0
0
0
Linked Open Data catalogues
0
Online resources
0
0
0
0
Open access documents
15
0
0
0
0
© 2013 - 2024 Lin|gu|is|tik | Imprint | Privacy Policy | Datenschutzeinstellungen ändern